Le passage aux modèles ajustés par instruction
Quelle est la base ?
Dans le passé, les grands modèles linguistiques de base étaient principalement formés à prédire le mot suivant dans une séquence à partir d'une quantité énorme de données. Toutefois, pour les développeurs, le véritable pouvoir réside dans les modèles LLM ajustés par instruction. Ces modèles sont affinés à l'aide de l'apprentissage par renforcement à partir du retour humain (RLHF) afin de suivre des commandes spécifiques et d'agir comme des assistants utiles.
La règle d'or :Traitez le modèle LLM comme un stagiaire intelligent mais littéral. Il manque de votre contexte spécifique, donc vous devez être explicite sur vos objectifs.
Comment appliquer les principes fondamentaux
- Clarté et précision: La clarté ne signifie pas concision. Fournir plus de contexte et utiliser des délimiteurs (comme les trois accents graves ou les balises XML) aide le modèle à distinguer vos instructions des données qu'il doit traiter.
- Donnez au modèle le temps de réfléchir : Les tâches complexes exigent une chaîne de raisonnement. Si vous demandez à un modèle de sauter directement à une conclusion, il est plus susceptible de commettre une erreur de raisonnement. Incitez-le à élaborer sa propre solution en premier lieu.
Éviter les hallucinations
Les modèles peuvent générer des informations « convaincantes » mais fausses. Vérifiez toujours les faits ou incitez le modèle à citer ses sources afin de réduire ce risque.
TERMINALbash — 80x24
> Ready. Click "Run" to execute.
>
Question 1
Why should a developer prefer an Instruction Tuned LLM over a Base LLM for building an application?
Challenge: Generating Structured Data
Apply prompting principles to format output.
You have a list of ingredients. You need to convert this list into a JSON format for a web app.
Task
Write a prompt that requests JSON output with keys for 'item' and 'quantity'. Include a condition check: If the input is not a recipe, output "No recipe detected."
Solution:
prompt = "You will be provided with text. If it contains a recipe, convert it to JSON with keys 'item' and 'quantity'. If not, write 'No recipe detected.' Text: <user_input>"